Day22 GraphRAG

2025 iThome 鐵人賽

DAY 22

AI & Data

AI初學者入門系列第 22 篇

17th鐵人賽

kitty71336

團隊新手小黑

2025-08-24 16:05:25

499 瀏覽

分享至

一、研究背景
檢索增強生成（Retrieval-Augmented Generation, RAG）在近年成為大型語言模型（LLM）落地應用的核心框架。流程為：將外部知識資料庫向量化並建立索引，用戶查詢時查詢相關內容，再結合至模型上下文中生成答案。

優點: 降低了模型的記憶負擔，並提升知識即時性與準確度。
缺點:

相似度導向檢索：只依賴向量相似度，無法捕捉跨文件的隱含關聯。
缺乏多跳推理能力：無法有效處理連結的查詢。
可解釋性不足：結果只呈現文字段落，很難知道知識鏈路。

因此，microsoft 團隊提出GraphRAG 作為新興架構，以圖結構（Graph）補強 RAG 系統，提升檢索與推理的能力。

二、GraphRAG 架構

知識圖譜建構(圖譜表示)

實體抽取（Entity Extraction）：從文件中抽取人名、地點、技術……等節點。
關係抽取（Relation Extraction）：判斷節點間的語意關聯，例如:引用、因果、合作。

檢索策略(混合檢索)

向量檢索：傳統 RAG 的語義相似度檢索。
圖結構檢索：利用圖遍歷和多跳推理，找出跨文件的隱含關聯。

答案生成
將檢索得到的文本片段與圖結構輸入 LLM，透過 Prompt 工程或結構化輸入JSON，最終生成結果

三、GraphRAG挑戰

建圖成本高：需大量運算和人工校對與修正。
維持複雜度：知識隨時間演化，圖結構需持續更新。
系統整合難度：如何有效融合 VectorDB 與 GraphDB，是工程落地的瓶頸。

四、簡單的例子

假設我們要查：「手機快充技術是怎麼發展的？」

傳統 RAG：找到一篇文章，告訴你 A 公司做了快充。
GraphRAG：
A 公司 → 快充晶片 → B 公司專利 → 充電標準 → C 公司合作
最後說明：這技術是多家公司合作、標準化之後才成熟。

五、代表公司

向量資料庫：Milvus、Weaviate
圖資料庫：Neo4j

Day21 MoE(Mixture of Experts)

Day23 多模態檢索（Multimodal RAG）

系列文

AI初學者入門共 30 篇

RSS系列文訂閱系列文

9 人訂閱

完整目錄

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

尚未有邦友留言

立即登入留言

參賽組數

902 組

團體組數

37 組

累計文章數

19838 篇

完賽人數

528 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

IntelliJ IDEA 右上方run箭頭反灰

IT邦幫忙

AI初學者入門系列 第 22 篇